我与 Gitee 开源审核事件

最近,有一条关于国内对标 Github 的代码托管平台 Gitee 开源仓库需要先进行审核的新闻刷遍科技圈(Gitee 新政被喷惨了,开源仓库必须先审核再上线)。

一时之间各种段子乱飞,什么 java、save 命中了 av 关键词被审核了。本来我也只是看个热闹,后来想起我自己在 Gitee 上也有一个仓库,是作为博客的图床在使用,吃瓜结果吃到了自己头上,赶紧登到平台上去看看。果然刚登陆账号就提示我的仓库现在只能是团队成员可见,需要提交申请才能变为公开。这也没办法呀,只能按着要求吭哧吭哧改了描述、README 的等信息,并且勾选了几个合规的承诺条款,提交变为 Public 可见的申请。

第二天晚上再登陆进去看,发现仓库直接变成私有仓库了,并且不能转成公开仓库,原因是仓库涉及图床外链。一下子火气就上来了,平台也没有个方便的反馈渠道,后面去网上搜了搜,Gitee 的 TOS 上确实也有提到仓库不能作为图床外链使用,好吧,这下申诉是没指望了,只能是换图床了。

我的文章现在是放在语雀上,是自定义的富文本格式,并不是标准的 Markdown 格式,文档中搜索不到图片链接,所以不能像之前 博客图床转移 一样写个 Python 脚本直接找到所有的 gitee 关键字的图片链接进行批量替换。这可难为到我了,还去语雀反馈的讨论区求助。自己能想到的办法就是先把 Gitee 仓库 clone 下来,在本地把所有的图片手动上传到 SM.MS,因为有些图片也比较大,中间还要传到 TinyPNG 上去压缩一遍,100 多张图片都经历了 上传到 TinyPNG 压缩 -> 下载压缩后的图片 -> 上传到 SM.MS -> 拿到 MD 链接 -> 在语雀文档中替换图片 这样的手动操作过程。可累死我了。

这几次的图床更换给我提了个醒,至少要做这么两件事:

最后关于 Gitee 开源仓库审核的事情,我是觉得审核还是必要的,一些不法分子利用开源平台来传播违法信息,比如存黄图、托管色情、博彩网站、宣传反华信息等等都是可能的。这些老鼠屎坏了一锅粥,肯定是需要监管的,有了监管,平台才有动力去做更多合规的技术改进。Gitee 这次开源仓库需要审核可能也是之前这方面的意识不够,没有提前做好技术建设。海量仓库如果靠人工审核,怎么审的过来呢,审核人员也不可能看懂每一行代码,还是需要通过技术手段来做。这次事件一出,确实会给很多想在 Gitee 上开源的开发者泼一大盆冷水,敲下 git push 命令的手也迟疑了。希望国内的开源生态能越来越好。